پیشگویی قابلیت فهم گفتار مبتنی بر مدل ادراکی میکروسکوپی

thesis
abstract

کاهش قابلیت فهم گفتار در شرایط نویزی یکی از متداول ترین مشکلات شنونده ها، به ویژه افراد دارای ضعف شنوایی است. توانایی پیش بینی قابلیت فهم می تواند باعث بهبود طراحی سیستم های صوتی و توسعه الگوریتم های کمک شنوایی در امر توانبخشی شود. روش های معمول برای پیش بینی قابلیت فهم، به شکل ماکروسکوپی عمل می کنند، به این معنی که ویژگی های ماکروسکوپی سیگنال، مانند طیف بلند مدت یا نسبت سیگنال-به-نویز (snr) در باندهای فرکانسی مختلف برای محاسبه استفاده می شوند. در مقابل، یک روش میکروسکوپی محاسبات خود را براساس ویژگی های طیفی- زمانی گفتار که شنونده درک می کند، قرار می دهد. در مدل میکروسکوپی، ساختار خاص طیفی- زمانی سیگنال صحبت احتمالا به گونه ای پردازش می شود که بسیار مشابه سیستم شنوایی انسان است. در این پایان نامه، یک مدل میکروسکوپی دوگوشی برای پیشگویی قابلیت فهم گفتار پیشنهاد شده است. ساختار مدل بر مبنای مدل تک گوشی ادراکی .jürgens et al و مدل پیشنهادی دوگوشی با استفاده از سلول های تحریک و ممانعت (ei cells) قرار دارد. ساختار مدل شامل دو مرحله آموزش و تست می باشد. در مرحله آموزش، ابتدا، سیگنال های گفتار الگو برای گوش های چپ و راست با نویز پس زمینه جمع شونده دلخواه، به عنوان ورودی به واحد پیش پردازش اعمال می شود، این پیش پردازش شامل فیلتربانک گاماتون، مدل سلول مویی و حلقه های انطباق می باشد. سپس، سیگنالهای پیش پردازش شده گوش های چپ و راست، وارد واحد پردازش دوگوشی می گردند. درنهایت ، سیگنال های بدست آمده از مسیرهای تک گوشی و دوگوشی توسط فیلتربانک مدولاسیون بطور جداگانه پردازش می شوند. حاصل این مراحل پردازش، نمایش های درونی (irs) برای سیگنال های الگوی تک گوشی و دوگوشی است. به طریق مشابه در مرحله تست، برای سیگنال های ورودی تست گوش های چپ و راست نیز مراحل پردازشی ذکر شده در بالا اعمال شده و نمایش های درونی (irs) برای سیگنال های تک گوشی و دوگوشی تست بدست می آیند. در نهایت، نمایش های درونی بدست آمده برای سیگنال های الگو و تست توسط سیستم بازشناسی گفتار dtw مقایسه می شوند تا سیگنال الگویی از مجموعه الگوهای ممکن دردسترس که کمترین فاصله را با سیگنال تست دارد، به عنوان سیگنال تشخیص داده شده انتخاب شود. میزان پیشگویی قابلیت فهم گفتار بر اساس نسبت تعداد سیگنال های درست تشخیص داده شده به تعداد کل سیگنال های الگو محاسبه می شود. ارزیابی مدل تحت انواع مختلف نویز (نویز شبه گفتار، همهمه، و گفتار معکوس) و چیدمان های مختلف فضایی منابع تداخل (بعبارتی، مکان های متفاوت منابع اخلال) انجام می گیرد. به منظور تعیین دقت نتایج، پیشگویی های مدل با نتایج آزمایشات شنوایی بر حسب آستانه دریافت گفتار (srt) مقایسه می شود. برای انجام آزمایشات شنوایی، 9 شنونده در فرآیند آزمایشات روان ادراکی شرکت دارند تا مقادیر srt را در شرایط شنوایی گوناگون اندازه گیری شود. در مورد نویز شبه گفتار، سه نوع آزمایش با بکارگیری یک منبع ، دو منبع و سه منبع نویز انجام می شود. ارزیابی نتایج برای این نوع نویز تطابق خوبی را در مورد مقادیر پیشگویی مدل با مقادیر اندازه گیری شنوایی ذهنی نشان داده و کارآیی بالای مدل را تایید می کند. برای نویز های همهمه و گفتار معکوس، تنها یک منبع نویز در آزمایش ها بکار رفته است. اما، برخلاف نویز شبه گفتار، در مورد این نوع از نویزها، هماهنگی خوبی بین پیشگویی های مدل و اندازه گیری های ذهنی مشاهده نمی شود.

First 15 pages

Signup for downloading 15 first pages

Already have an account?login

similar resources

مدل میکروسکوپی دوگوشی مبتنی بر فیلتر بانک مدولاسیون برای پیش گویی قابلیت فهم گفتار در افراد دارای شنوایی عادی

In this study, a binaural microscopic model for the prediction of speech intelligibility based on the modulation filter bank is introduced. So far, the spectral criteria such as the STI and SII or other analytical methods have been used in the binaural models to determine the binaural intelligibility. In the proposed model, unlike all models of binaural intelligibility prediction, an automatic ...

full text

پیشگویی قابلیت فهم گفتار در افراد دارای ضعف شنوایی

یک معیار اندازه گیری قابلیت فهم که همبستگی زیادی با نتایج تست های شنوایی دارد، دارای اهمیت بسیاری در بسیاری از کاربرد ها از جمله طراحی ادوات کمک شنوایی می باشد. این پایان نامه به مسئله ی پیشگویی قابلیت فهم سیگنال گفتار برای شنونده های دارای ضعف شنوایی می پردازد که راه حل پیشنهادی آن در خصوص شنونده های عادی نیز به عنوان شرایط خاصی که در آن میزان ضعف شنوایی قابل اغماض است، کاربرد پذیر است. در این...

کاربرد تحلیل ادراکی پیشگویی خطی جهت پنهان ‎سازی اطلاعات گفتار

امروزه با پیشرفت فناوری، داده¬های دیجیتال می¬توانند به¬صورت شبکه به آسانی اشتراک گذاشته شوند و در اختیار همگان قرار گیرند؛ که باعث کپی¬های غیرمجاز، توزیع داده¬های دیجیتال و از بین بردن حقوق مالکین اثر می¬گردد. هدف پنهان¬سازی صوتی استفاده فناوری برای مخفی کردن اطلاعات در یک فایل صوتی است به¬گونه¬ای که قابل شنیدن نبوده و تأثیری در کیفیت صدای فایل اصلی نداشته باشد. طی این تحقیق از روش تحلیل ادراکـ...

15 صفحه اول

تاثیر فیلترینگ روی قابلیت فهم گفتار فارسی

دانستنِ اطلاعات آوایی در باندهای مختلف فرکانسی، به درک صحیح شنیداری ما کمک بسزایی می کند. بطوریکه با حذف یا فیلتر کردن بخشی از این اطلاعات، می توان تاثیر این پارامتر را روی قابلیت فهم گفتار بدست آورد. با دانش صحیح از علم آواشناسی اکوستیکی و آواشناسی شنیداری و تاثیر آنها بر روی فرمنت ها و هارمونیک های اصلی آواهای فارسی می توان با فیلتر کردن این هجاها و ارزیابی آنها توسط افراد مختلف (تست سایکوآکو...

بررسی تأثیر افت شنوایی بر مهارت های سریع حرکتی دهانی، سرعت گفتار و قابلیت فهم گفتار

هدف: تأثیر منفی افت شنوایی بر مهارتهای حرکتی سریع اندام های گفتاری، سرعت گفتار و قابلیت فهم گفتار هر یک به تنهایی در افراد کم شنوا به اثبات رسیده است. بررسی نحوه این تأثیرگذاری در آستانه های مختلف شنوایی و چگونگی وجود ارتباط بین این سه متغیر گفتاری و ارتباط بین آزمون های موجود برای بررسی این متغیرها هدف این پژوهش می باشد. روش بررسی: این مطالعه تحلیلی مقطعی بر روی 46 بزرگسال مبتلا به افت شنوایی ...

full text

پیشگویی گام‌ـ بلند سرعت باد مبتنی بر مدل ترکیبی RNNGA

For proper and efficient utilization of wind power, the prediction of wind speed is very important. Wind is one of the main sources of energy in the world, but the wind turbines have a lack of reliability, continuity and homogeneity in power production. On the other hand, sudden changes of wind speed, lead to risk for wind turbine units health. Therefore, the prediction of wind speed for turbin...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز - دانشکده مهندسی برق و کامپیوتر

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023